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摘 2: [目的 /意义 ] 探 究 大 语言 模型 (Large Language Models, LLMs) 等 人 工 智 能 生成 技术 对 用 户 信息 检索 行为 产 成 的 
影响 ， 为 信息 检索 系统 和 信息 资源 建设 建言 献策 。 [方法 / 过 程 ] 以 ChatGPT 等 LLMs 的 茵 勃发 展 为 背景 ， 结 合 大 语言 模型 的 技 
术 特 点 与 现 有 产品 的 特征 ， 从 用 户 信息 行为 的 视角 ， 通 过 探讨 现 有 文献 和 大 型 语言 模型 ， 分 析 该 技术 的 不 断 普及 对 信息 检索 
系统 与 用 户 检 索 行 为 的 影响 。 [结果 / 结论 ]LLMs 用 作 信 息 检索 系统 具有 传统 产品 无 法 比拟 的 优势 ， 其 对 用 户 信息 检索 行为 的 
底层 逻辑 、 行 动 重点 与 检索 期 望 等 方面 都 会 产 成 影响 。 然 而 LLMs 现 有 可 靠 性 、 准 确 度 等 缺陷 仍 难以 使 其 立刻 取代 传统 信息 检 
索 方 式 。 建 议 在 信息 检索 系统 和 信息 资源 建设 中 重视 该 技术 ， 探 索 LLMs 与 信息 服务 智能 结合 ， 以 应 对 未 来 用 户 信息 需求 的 变 
化 ， 并 进一步 充分 利用 已 有 信息 资源 的 价值 。 
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I) 


ChatGPT 上 线 不 到 两 个 月 活跃 用 户 量 就 突破 了 1 在 图 书 情报 领域 ， 随 着 人 工 智 能 技术 在 文献 情报 


亿 ， 引 起 学 界 的 广泛 关注 。 它 能 够 以 对 话 的 方式 与 人 
交互 ， 包 括 根 据 上 下 文 回 答 问题 、 承 认错 误 、 挑 战 错 
误 、 拒 绝 用 户 不 恰当 的 请 求 等 。 以 ChatGPT 为 代表 
的 大 型 语言 模型 (Large Language Models, LLMs) 不 
仅 能 够 理解 用 户 的 意图 和 情感 ， 还 能 够 生成 有 趣 和 有 
创意 的 内 容 ， 如 诗歌 、 故 事 、 歌 词 等 中。LLMs 的 广泛 
应 用 可 以 说 是 人 工 智 能 领域 的 一 个 里 程 碑 ， 人 工 智 能 
内 容 生 成 (Artificial Intelligence Generated Content， 
AIGC) 也 已 成 为 各 行业 关注 的 焦点 。 
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工作 中 的 广泛 应 用 ， 以 ChatGPT 为 代表 的 LLMs 也 成 
为 图 情 档 专业 热 议 的 话题 。 讨 论 的 焦点 主要 集中 在 
LLMs 在 智慧 图 书馆 服务 、 情 报 收集 、 人 情报 处 理 、 情 报 
分 析 等 领域 中 的 应 用 。 在 这 些 领域 ，LLMs 能 够 通过 自 
然 语 言 问答 的 形式 完成 历史 数据 的 获取 ， 提 供 自动 化 
的 摘要 、 分 类 和 关键 词 提取 等 情报 工作 8。LLMs 还 能 
通过 自然 语言 生成 技术 ， 为 用 户 提供 个 性 化 的 文献 推 
和 问答 服务 ， 构 建 AIGC 时 代 的 智能 图 书馆 等 四 。 

站 在 用 户 信息 行为 的 视角 来 看 ，ChatGPT 等 面向 
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用 户 的 LLMs 作为 一 种 以 自然 语言 交互 方式 实现 的 聊 
天 机 器 人 ， 将 信息 采集 、 组 织 、 检 索 和 利用 融 为 一 体 ， 
为 用 户 带 来 了 前 所 未 有 的 使 用 体验 。 已 经 有 研究 发 现 
部 分 用 户 正 在 积极 利用 这 类 工具 满足 自己 的 工作 需求 9 
随 着 GPT-4、 文 心 一 言 、Bard、Midjourney 等 竞 品 的 
不 断 上 线 ，AI 工具 颇 有 产业 革命 之 势 ， 应 用 场景 不 断 
快速 拓展 。 信 息 服 务 是 信息 管理 工作 的 起 点 和 终点 ， 
而 信息 服务 的 最 终 目 的 是 满足 信息 用 户 的 信息 需求 。 
因此 ， 在 研究 LLMs 对 文献 情报 工作 的 影响 的 同时 ， 
也 需要 研究 其 对 用 户 信 息 行 为 的 影响 ， 以 此 为 今后 建 
立 具 有 中 国 特色 的 AIGC 信息 平台 以 及 信息 素养 教育 
体系 提供 启示 和 参考 。 


1 文献 回顾 


信息 检索 行为 是 国内 外 学 者 长 期 关注 的 重要 研究 
领域 。 自 20 HE2 90 年 代 以 来 ， 互 联网 拓宽 了 大 众 的 
信息 获取 渠道 ， 使 得 计算 机 和 互联 网 成 为 学 术 界 信息 
检索 研究 的 基本 背景 "?。 随 着 计算 机 技术 和 算法 进步 ， 
信息 检索 研究 逐步 深入 。 初 期 聚焦 于 文本 检索 优化 和 
多 媒体 信息 检索 ， 以 满足 用 户 需 求 吧 。 近 年 来 ， 知 识 
图 谱 、 深 度 学 习 和 自然 语言 处 理 等 技术 的 应 用 在 提升 
仿 索 效率 和 精度 的 同时 ， 基 于 用 户 画 像 和 行为 的 信息 
推荐 成 为 新 的 研究 热点 上 中。 信息 检索 领域 的 下 一 步 是 
运用 深度 学 习 方 法 不 断 训 练 人 工 智 能 大 模型 ， 做 到 能 
根据 用 户 意图 直接 生成 丰富 的 多 媒体 内 容 ， 进 一 步 释 
放 用 户 生 产 力 。 

相对 地 ， 信 息 检索 技术 的 进步 也 导致 用 户 信息 检 
索 行为 研究 热点 的 变化 。 国 内 外 学 者 最 初 旨 在 通过 研 
究 用 户 信 息 检索 行为 ， 为 信息 检索 系统 提供 改进 建议 。 
随 着 计算 机 科学 、 心 理学 、 医 学 信息 学 等 领域 的 交叉 
融合 ,学界 研究 内 容 逐 渐 多 元 化 ， 信 息 检 索 行 为 演化 
出 多 个 研究 主题 与 研究 热点 。 

(1) 不 同 用 户 群 体 的 信息 检索 行为 研究 。 国 内 外 
信息 检索 行为 研究 均 涉 及 不 同 信息 用 户 群 体 ， 并 针对 
不 同 群体 用 户 的 信息 行为 特点 进行 剖析， 其 中 对 大 学 


生 群 体 的 研究 较 多 。 吴 智 兰 等 通过 研究 大 学 生 在 线 健 
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康信 息 检 索 行 为 特征 与 模式 探讨 网 络 健康 信息 服务 应 
如 何 开 展 凸 ; 张 敏 等 基于 性 别 差 异 对 用 户 网 络 健康 信 
息 检 索 行 为 进行 分 析 ， 发 现 性 别 差 异 对 健康 信息 检索 
全 过 程 中 的 行为 模式 具有 显著 影响 外，BILAL 等 通过 
比较 初中 学 生 与 研究 生 的 网 络 信 息 检索 行为 ， 对 比 二 
者 在 直觉 、 感 情 和 生理 行为 方面 的 差异 中 。 罗 赛 峰 则 
结合 认 知 科学 与 情报 学 对 儿童 群体 的 信息 检索 行为 进 
ÍT THEN, 

(2) 不 同 场景 或 情景 下 的 信息 检索 行为 研究 。 场 
景 主 要 指 图 书馆 、 社 交 媒 体 等 用 户 获 取信 息 的 场所 或 
网 址 。 如 张 路 路 等 通过 将 用 户 按照 认 知 风格 分 类 ， 探 
讨 了 用 户 的 认 知 风格 与 数字 图 书馆 环境 下 信息 检索 行 
为 的 关系 ， 并 得 出 前 者 的 确 会 影响 后 者 的 结论 上 四; 情 
景 则 主要 指 旅游 、 餐 饮 、 任 务 情景 等 用 户 获取 信息 的 
背景 或 环境 。 如 ARIF 等 设计 了 一 个 协作 式 旅游 信息 搜 
索 系 统 并 与 旅游 网 站 Tripadvisor.com 进行 对 比 实验 ， 
结果 发 现 用 户 协 作 式 旅游 信息 搜索 系统 的 确 可 以 促进 
游客 的 协作 信息 检索 行为 ， 并 在 易 用 性 和 合作 支持 等 
方面 明显 优 于 对 比 旅游 网 站 "9。 

(3) 不 同 信 息 类 型 的 信息 检索 行为 研究 。 该 研究 
主题 中 健康 信息 检索 行为 占 比 较 高 ， 其 一 直 是 医学 信 
息 学 领域 的 研究 内 容 ， 其 他 种 类 的 信息 也 有 学 者 补充 
研究 。 王 文 所 等 梳理 并 评价 了 当时 在 线 健康 信息 检索 
行为 的 实证 研究 ， 并 对 实验 研究 拓展 提出 建议 中。 王 
若 佳 等 则 基于 日 志 挖 掘 的 方法 ， 发 现 健康 信息 用 户 倾 
向 于 不 修改 查询 词 、 点 击 排名 较 高 的 网 页 、 偏 好 知识 
问答 平台 等 特点 中 。 王 丽 佳 则 以 大 学 生 为 研究 群体 ， 
探讨 了 网 络 学 术 信息 的 检索 行为 中 。 

除 此 以 外 ， 学 界 还 就 用 户 信息 检索 行为 影响 因素 、 
用 户 信息 检索 行为 模型 构建 等 角度 展开 了 研究 Po20。 

当前 ，LLMs 的 不 断 落 地 正 对 信息 管理 领域 产生 巨 

影响 ， 图 情 学 界 正 广泛 讨论 人 工 智 能 对 信息 检索 领 
域 产生 的 影响 。 潘 正 源 等 通过 与 传统 信息 检索 研究 范 
式 进行 对 比 ， 提 出 智能 信息 检索 研究 范式 演进 趋势 ， 体 
现 出 智能 信息 检索 是 信息 检索 领域 未 来 的 研究 方向 叫 。 
寿 建 琪 提出 了 一 种 自 适 应 文献 检索 框架 ,能够 与 多 种 
大 语言 模型 相 结 合 ， 其 检索 能 力 在 可 靠 性 与 灵活 性 上 


均 优 于 现 有 的 检索 方法 ,体现 了 不 俗 的 应 用 潜力 外。 
因此 研究 用 户 信息 检索 行为 时 有 必要 将 大 型 语言 模型 
的 影响 考虑 在 内 。 本 文 主要 在 现 有 研究 的 基础 上 ， 探 
讨 大 型 语言 模型 对 用 户 信 息 检 索 行 为 的 影响 。 


2 LLMs 对 信息 检索 系统 的 影响 


信息 检索 系统 是 用 户 信息 检索 的 工具 和 环境 。 在 
研究 用 户 行为 之 前 ， 需 要 探讨 LLMs 会 从 哪些 方面 影 
响 或 改变 信息 检索 系统 。 总 的 来 说 ， 基 于 LLMs 建立 
的 信息 检索 系统 将 带 来 全 新 的 信息 检索 方式 ， 对 于 提 
升 用 户 信息 检索 的 效率 有 积极 作用 。 但 LLMs 作为 
“文本 生成 ”工具 ， 并 非 专门 为 信息 检索 而 开发 和 训 
练 ， 存 在 一 定 的 可 靠 性 问题 ; 同时 ， 如 果 LLMs 不 接 
入 互联 网 ， 由 于 其 语料库 和 训练 集 固定 不 变 ， 数 据 价 
值 会 随 着 时 间 不 断 折 旧 ， 最 终 失 去 信息 检索 必需 的 时 
效 性 。 因 此 ，LLMs 接 入 后 的 信息 检索 系统 有 很 多 问题 
需要 开发 者 提前 注意 和 准备 。 


2.1 LLMs 具有 语言 理解 能 力 ， 能 实现 真正 
的 自然 语言 检索 


信息 检索 的 本 质 是 用 户 的 信息 需求 与 对 应 信息 集 
合 的 匹配 。 在 信息 用 户 使 用 当前 常用 的 检索 工具 时 ， 
普遍 需 花 费时 间 和 精力 思考 关键 词 及 其 组 合 。 基 于 
LLMs 的 信息 检索 则 更 加 自然 、 直 观 ， 用 户 可 以 直接 使 
用 自然 语言 描述 信息 需求 向 大 语言 模型 索取 答案 。 若 
在 提供 答案 后 进一步 提问 ，LLMEs 会 根据 原 有 答案 文本 
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利用 其 自然 语言 处 理 技术 可 以 将 检索 结果 直接 转译 为 
多 种 语言 ， 翻 译 质量 并 不 逊色 于 市 场 竞 品 。 此 外 ， 由 
于 其 训练 数据 还 包括 了 各 种 口头 表达 、 书 面 语言 和 方 
言 等 ，ChatGPT 能 够 理解 用 户 的 多 样 化 表达 ， 大 大 降 
低 了 用 户 表达 信息 需求 的 难度 。 因 此 ， 与 传统 信息 检索 
方式 相 比 ， 基 于 LLMs 的 信息 检索 模式 具有 更 加 复杂 和 
精准 的 语言 理解 和 分 析 能 力 ， 可 以 更 好 地 理解 用 户 查 询 
的 语义 和 意图 ， 能 够 实现 更 深 维度 的 信息 资源 揭示 。 而 
用 户 可 以 直接 用 自然 语言 表达 自己 的 信息 需求 ， 无 需 考 
虚 特 定 的 关键 词 或 检索 语法 ， 大 大 降低 了 使 用 门槛 。 


2.2 LLMs 深入 信息 组 织 语 义 层面 ， 为 信息 
检索 系统 降 本 增 效 


传统 的 基于 关键 词 匹 配 、 元 数据 匹配 的 信息 检索 
系统 对 信息 的 理解 大 多 停留 在 词义 理解 ， 而 LLMs 能 
够 基于 文本 理解 与 内 容 分 析 进 行 更 为 深入 的 信息 组 织 。 
信息 组 织 模式 的 变化 也 为 信息 检索 模式 带 来 深刻 影响 。 

(1) 大 大 降低 信息 资源 建设 的 时 间 与 成 本 。 使 用 
LLMs 在 知识 库 检 索 时 ， 由 于 模型 能 够 理解 与 生成 自然 
语言 ， 构 建 知识 库 时 不 需要 再 对 进行 传统 意义 上 的 信 
息 标 引 ， 模 型 内 整个 检索 流程 通过 自然 语言 即 可 完成 。 
而 当 大 型 语言 模型 用 于 传统 信息 资源 建设 时 ， 比 如 将 
LLMs AIL RIE, ， 对 文本 进行 语义 识别 ， 调 整 索 
引 ， 加 快 搜索 引擎 的 响应 速度 和 优化 搜索 结果 ， 大 幅 
提高 资源 配置 效率 与 准确 性 。 目 前 微软 公司 已 经 将 族 
下 搜索 引擎 Bing HA GPT 模型 供 公 众 使 用 。 或 者 将 语 


与 用 户 基 于 此 提出 的 上 下 文 ， 更 加 准确 地 匹配 用 户 的 
搜索 意图 ， 提 供 更 与 实际 需求 匹配 的 搜索 结果 。 以 
ChatGPT 为 例 ， 用 户 直 接 在 界面 通过 自然 语言 提出 信 
息 需 求 ， 模 型 接收 指令 后 会 将 其 转换 为 机 器 可 读 格 式 ， 
使 用 词法 分 析 、 句 法 分 析 、 语 义 分 析 和 上 下 文 分 析 等 
自然 语言 处 理 技术 来 分 析 输 入 的 数据 ， 实 现 对 用 户 意 
图 的 理解 。 随 后 模型 自动 从 知识 库 中 检索 相关 信息 ， 
生成 其 认为 最 符合 用 户 需 求 的 答案 或 结果 ， 同 样 以 连 
贯 易 懂 的 自然 语言 输出 。 

因 其 语义 理解 的 特性 ， 原 有 信息 检索 不 同 语种 之 间 
的 壁垒 也 被 打破 。 比 如 在 多 语言 文献 检索 时 ，ChatGPT 


言 模型 用 于 知识 图 谱 构 建 ， 提 升 实体 识别 和 关系 抽取 
的 精度 ， 以 丰富 知识 图 谱 的 内 容 和 关联 度 。 

(2) 可 以 拓宽 信息 检索 系统 的 功能 边界 。 以 往 基 
于 词义 理解 和 特征 匹配 的 信息 检索 模式 仅 限 于 完成 
“找到 信息 ”的 任务 ， 而 LLMs 不 仅 可 以 搜寻 信息 ， 还 
可 以 直接 分 析 和 处 理 该 信息 ， 直 接 向 用 户 提供 可 用 的 
信息 产品 。 以 GPT-3.5 模型 为 例 ， 其 可 以 完成 摘出 科 
技 文献 中 研究 方法 和 研究 思路 、 总 结 剧本 的 情节 梗概 、 
将 不 同 网 络 新 闻 按 既定 主题 聚 类 、 生 成 摘要 、 答 案 、 
文章 、 目 录 等 任务 ， 在 得 到 信息 检索 结果 后 可 以 立刻 
完成 情报 预 处 理工 作 。 
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2.3 LLMs 具有 即时 任务 处 理 能 力 ， 革 新 信 
息 检 索 的 用 户 体验 


用 于 LLMs 训练 的 文本 数据 集 通常 包括 了 社交 媒 
体 帖子 、 新 闻 等 内 容 ， 结 合 “ 人 类 反馈 强化 学 习 ” 
(Reinforcement Learning from Human Feedback, RLHF) 
的 训练 方式 ， 因 此 LLMs 能 够 模仿 人 类 的 语言 表达 方 
式 和 思考 模式 ， 并 能 够 模仿 人 类 进行 对 话 和 交流 。 传 
统 的 信息 检索 模式 无 法 做 到 快速 对 用 户 提出 的 信息 需 
求 进行 即时 响应 ， 而 像 ChatGPT 这 种 逐 字 跳动 生成 回 
答 的 交互 界面 不 仅 能 做 到 及 时 响应 用 户 ， 还 可 以 为 用 
户 带 来 心理 上 的 亲密 感 。 这 种 即时 生成 模式 所 带 来 的 
临场 感 是 传统 检索 方式 不 具备 的 特点 。 

即时 生成 的 特点 也 使 用 户 可 以 立刻 进行 信息 反馈 。 
用 户 如 果 不 满 意 输出 结果 ， 可 以 在 交互 界面 直接 指出 
错误 ， 命 令 模型 改进 结果 。 用 户 也 可 以 通过 点 踩 、 重 
新 生成 结果 、 提 交 反 馈 等 方法 反哺 语言 模型 的 训练 。 
大 型 语言 模型 会 根据 反馈 结果 不 断 学 习 和 优化 ， 改 进 
其 回答 内 容 和 回答 方式 ， 用 户 的 使 用 体验 能 够 实时 优 
化 。 这 些 都 是 传统 检索 方式 难以 匹敌 的 优势 。 不 过 ， 
尽管 LLMs 具有 “类 人 性 ”， 但 仍 是 一 个 机 器 学 习 模 
型 ， 本 质 上 仍 不 具备 人 类 的 情感 、 直 觉 和 创造 力 ， 其 
潜能 还 有 待 进一步 地 开发 。 


2.4 LLMs 采取 智能 问答 模式 ， 可 以 实现 
“ 横 纵 一 体 ” 立 体 化 检索 结果 


目前 大 多 数 LLMs 的 用 户 界面 都 是 以 智能 问答 、 
机 器 人 聊天 的 形式 呈现 。 其 优点 在 于 能 直接 输出 语义 
连贯 和 可 读 性 强 的 回答 ， 不 需要 用 户 进行 多 次 的 点 击 
和 筛选 ， 大 大 节省 了 用 户 获 取信 息 的 时 间 。 同 时 ， 这 
种 信息 的 呈现 方式 还 使 用 户 能 够 非常 简单 地 归档 以 前 
的 检索 结果 ， 便 于 对 检索 结果 的 回顾 。 从 用 户 交 互 的 
角度 来 看 ， 这 也 下 意识 地 提醒 用 户 输入 的 内 容 以 及 提 


检索 结果 其 实 不 止 于 此 。 用 户 可 以 沿 着 回答 的 脉络 往 
下 继续 追问 ， 比 如 向 LLMs 提出 “我 需要 更 具体 的 信 
息 ”“ 你 认为 这 种 现象 会 产生 什么 样 的 后 果 ”“ 可 以 
为 我 介绍 一 下 与 之 相对 立 的 观点 吗 ” 等 问题 。 也 可 以 
基于 回答 由 上 漳 源 进行 追问 ， 比 如 提出 “你 的 回答 中 
提 到 了 甲 ， 请 解释 甲 这 个 概念 ”“ 你 认为 造成 这 种 现 
象 的 原因 是 什么 ”等 问题 。 这 种 检索 方式 可 以 使 信息 
用 户 在 很 短 的 时 间 内 对 一 个 陌生 的 概念 或 观点 建立 初 
步 的 认识 ， 了 解 其 来 龙 去 脉 ， 拓 宽 自 身 视 野 ， 形 成 纵 
向 的 “ 链 式 检索 ”。 

用 户 还 可 以 利用 LLMs 的 语义 理解 特性 ， 形 成 对 
概念 、 观 点 等 信息 需求 的 “横向 检索 ”"。 比 如 用 户 可 以 
将 研究 论文 输入 模型 ， 在 LLMs 自动 分 析 文 本 、 识 别 
语义 、 抽 取 关 系 之 后 ， 用 户 便 可 以 根据 输入 内 容 进 行 
操作 ， 包 括 翻 译文 本 、 提 取 摘 要 、 归 纳 段 落 主 由 、 寻 
找 具体 内 容 、 自 动 建立 索引 、 简 单 地 可 视 化 展示 等 工 
作 。 这 种 检索 方式 使 得 用 户 可 以 快速 梳理 和 剖析 内 容 
的 结构 和 逻辑 ， 提 高 信息 细 粒 度 ， 让 用 户 可 以 像 “ 搭 
积木 ”一 样 在 检索 平台 中 就 完成 信息 的 拆 分 、 合 并 与 
分 析 。 可 以 说 这 种 “ 横 纵 结合 ”的 智能 化 的 检索 方式 
能 够 实现 用 户 对 信息 需求 的 立体 化 认 知 ， 是 信息 检索 
服务 的 一 次 巨大 变革 (图 1)。 


2.5 LLMs 给 信息 检索 系统 带 来 的 挑战 


(1) 运营 成 本 。 上 文 提 到 ， 传 统 信 息 检索 系统 主 
要 依赖 于 关键 词 匹配 和 基于 规则 的 算法 来 检索 信息 , 
LLMs 则 能 够 通过 深度 学 习 和 自然 语言 处 理 技术 ， 理 解 
用 户 的 语义 意图 和 上 下 文 信息 ， 从 而 提供 更 准确 的 相 
关 信息 。 这 对 信息 检索 系统 提出 了 更 高 的 要 求 ， 需 要 
保证 有 充足 的 算 力 ， 还 需要 不 断 改 进 算法 和 更 新 技术 ， 
以 满足 用 户 的 信息 需求 。 这 些 会 带 来 系统 运营 成 本 的 
大 幅 提 升 ， 对 现 有 信息 检索 系统 运营 商 来 说 可 能 会 造 
成 巨大 的 压力 ， 可 能 需要 寻求 与 大 型 科技 公司 的 合作 


问 方式 都 会 对 输出 的 检索 结果 产生 影响 ， 提 示 用 户 自 
发 挖 据 自身 真实 的 信息 需求 ， 提 高 查 准 率 。 在 实际 检 
索 时 ， 大 多 LLMs 会 倾向 于 提供 一 个 详 略 得 当 的 答案 ， 
但 由 于 LLMs 基于 深度 学 习 构 建 了 大 规模 的 知识 网 络 ， 


2023 年 第 35 卷 第 11 期 


或 寻找 其 他 技术 解决 方案 ， 以 降低 成 本 和 压力 。 

(2) 数据 隐私 和 安全 。LLMs 需要 大 量 的 数据 来 进 
行 训 练 和 优化 ， 而 这 些 数 据 往 往 包 含 着 用 户 的 个 人 信 
息 和 人 敏感 信息 。 保 证 数据 隐私 和 安全 需要 从 多 个 方面 


横向 检索 


信息 检索 结果 


内 容 总 结 


内 容 拆 分 提取 


RUSE, XEŽ 


大 语言 模型 对 信息 检索 系统 与 用 户 检索 行为 影响 研究 


纵向 检索 


图 1 LLMs 支持 下 实现 的 “ 横 纵 结合 ” 式 检索 


Fig. 1 "Combined horizontal and vertical" retrieval with the support of LLMs 


入 手 ， 包 括 数据 匿名 化 、 加 密 技 术 、 访 问 控制 、 隔 离 
数据 、 第 三 方 审计 以 及 不 断 修订 用 户 隐私 保护 政策 等 。 
只 有 综合 考虑 并 落实 这 些 措 施 ， 才 能 有 效 保护 用 户 数 
据 隐 私 和 库 内 数据 安全 ， 保 证 隐私 不 会 被 暴露 在 检索 
系统 中 。 


3 LLMs 对 用 户 信息 检索 行为 的 影响 


LLMs 为 信息 检索 系统 带 来 更 先进 的 技术 和 更 高 的 
准确 度 ， 以 此 满足 用 户 的 检索 需求 。LLMs 的 广泛 应 用 
意味 着 用 户 与 信息 检索 系统 的 交互 方式 正在 发 生 改 
变 。 用 户 不 再 只 是 输入 简单 的 关键 词 进 行 检索 ， 而 是 
可 以 通过 自然 语言 提出 更 加 具体 和 复杂 的 问题 ， 获 取 
更 加 个 性 化 的 检索 结果 。 可 见 大 型 语言 模型 不 仅 推动 


了 信息 检索 系统 的 发 展 ， 也 给 用 户 的 信息 检索 体验 带 
来 变化 。 


3.1 用 户 信息 检索 行为 逻辑 的 改变 : M 
法 ”到 “加 法 ” 

与 传统 的 关键 词 搜索 不 同 ，LLMs 的 搜索 结果 与 用 
户 提 出 的 检索 需求 同样 都 经 过 了 自然 语言 处 理 技术 处 
理 ， 加 之 LLMs 拥有 的 即时 处理 能 力 ， 这 使 得 用 户 信 


息 检 索 的 逻辑 发 生变 化 。 在 使 用 传统 搜索 引擎 时 ， 用 
户 为 提高 查 全 率 和 查 准 率 ， 往 往 需 要 “做 减法 ”， 对 自 
身 的 信息 需求 进行 提炼 ， 总 结 成 数 个 关键 词 ， 在 此 基 
础 上 进行 检索 策略 的 调整 。 而 在 利用 LLMs 检索 时 ， 
由 于 全 流程 通过 自然 语言 进行 ， 保 证 检索 与 存储 一 臻 
性 的 受 控 语言 不 复 存 在 ， 因 此 用 户 可 以 直接 “做 加 
法 ”， 先 将 粗略 的 想法 输入 模型 生成 初步 的 结果 ， 再 通过 
不 断 地 追问 、 限 定 范 围 等 方法 来 获取 最 佳 的 检索 结果 。 

这 种 改变 体现 在 LLMs 回复 的 质量 很 大 程度 上 取 
决 于 用 户 提问 的 水 平 ， 简 单 举例 ， 向 ChatGPT 分 别 输 
入 “哥伦布 ”和 “请 你 扮演 一 位 历史 老师 ， 现 在 需要 
你 向 学 生 们 介绍 一 下 哥伦布 ， 时 长 大 约 3 分 钟 ”这 两 
个 问题 ， 其 检索 结果 的 详细 程度 和 侧重 点 完全 不 同 ， 
后 者 输 出 的 结果 对 于 正在 备课 的 历史 教师 明显 更 有 帮 
助 和 价值 。 因 此 ， 用 户 检索 需要 考虑 的 重点 由 如 何 构 
建 检索 策略 变 成 了 如 何 正 确 高 效 地 向 模型 提问 。 巾 于 
自然 语言 检索 更 加 符合 人 类 直觉 ， 信 息 用 户 未 来 可 能 
会 逐渐 习惯 使 用 自然 语言 来 表达 他 们 的 问题 ， 关 键 词 
搜索 的 地 位 可 能 会 逐渐 下 降 ， 对 目前 以 “构建 检索 策 
略 ”“ 提 高 查 全 率 和 碍 准 率 ”为 培养 目的 的 信息 检索 
课程 也 将 会 受到 一 定 程 度 的 冲击 。 
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3.2 用 户 信息 检索 行为 重点 的 改变 ， 从 “ 找 
到 ”到 “甄别 ” 


LLMs 作为 一 站 式 检索 平台 具有 得 天 独 厚 的 优势 ， 


率 ， 成 为 用 户 评价 信息 检索 系统 的 重要 维度 。 现 阶段 
的 LLMs 以 其 “类 人 性 ”已 经 在 部 分 领域 拥有 较 多 应 
用 场景 ,传媒 领域 将 其 用 于 内 容 总 结 、 标 题 生成 以 及 
底稿 撰写 ; 教育 工作 者 将 其 用 于 问题 回答 、 对 话 练习 、 


但 LLMs 的 训练 目的 是 为 用 户 提 供 完 整 的 自然 语言 处 
理 服务 ， 这 决定 了 LLMs 具有 创造 性 ， 信 息 检索 只 是 
衍生 功能 之 一 。 由 于 其 信息 输出 并 不 完全 按照 狭义 信 
息 检 索 “ 比 较 - 匹配 ”模式 ， 因 此 即使 LLMs 普遍 拥有 
巨大 的 知识 库 ， 生 成 内 容 的 准确 性 和 完整 度 依然 无 法 
得 到 保证 。 所 以 在 使 用 LLMs 检索 时 ， 甄 别 信息 的 真 
实 性 和 可 靠 性 将 可 能 成 为 用 户 关注 的 新 重点 。 

首先 ， 由 于 目前 大 多 数 LLMs 的 训练 数据 集 都 是 
通过 互联 网 获取 的 开源 数据 (包括 维基 百科 、 新 闻 文 
章 、 书 籍 、 网 页 、 论 坛 、 社 交 媒 体 等 )， 缺 乏 非 OA 学 
术 文 献 等 高 质量 的 语料库 进行 训练 ，LLMs 在 面 对 许 多 
专业 问题 时 的 回答 会 显得 捉襟见肘 、 缺 乏 深度 ， 甚 至 
胡 编 乱 造 。WAGNER 等 的 研究 表明 ，ChatGPT-3 在 面 
对 放射 医学 不 同 领域 的 88 项 随机 问题 时 仅 有 67% 的 正 
确 率 ， 而 列 出 的 参考 信息 能 够 在 互联 网 中 被 检索 到 的 
占 比 仅 有 36.2%, FL LLMs 用 于 科研 工作 时 价值 有 
限 ， 检 索 结果 在 用 于 专业 研究 时 需要 信息 用 户 谨慎 甄 
a, FOR, LLMs 会 根据 用 户 的 倾向 、 喜 好 以 及 对 话 记 
录 调整 其 生成 内 容 (即使 并 不 符合 事实 )， 以 迎合 用 户 
表达 出 的 检索 需求 ， 所 以 用 户 不 得 不 花费 精力 在 提问 
策略 的 调整 与 内 容 查 证 上 。 最 后 ， 随 着 LLMs 不 断 在 
工作 生活 中 普及 ，AIGC 的 信息 占 比 将 越 来 越 多 ， 由 于 
AIGC 内 容 普 遍 都 具有 逻辑 条 理 和 清晰 结构 ， 即 使 内 容 
完全 虚构 ， 也 很 可 能 被 识别 力 不 高 的 用 户 误 用 。 

因此 ， 用 户 在 检索 时 不 得 不 考虑 到 LLMs 提供 信 
息 的 真实 性 ， 如 何在 信息 流 中 识别 出 基于 AIGC 生成 
的 虚假 信息 也 将 成 为 信息 检索 工作 的 重要 内 容 。 


3.3 用 户 信息 检索 行为 期 望 的 改变 : M 
和 全 的 线索 ”到 “好 和 快 的 产品 ” 
H F LLMs 可 以 直接 为 用 户 摆 稿 、 翻 译 、 咨 询 、 


答疑 ， 提 供 立 即 可 用 的 信息 产品 ， 因 此 检索 结果 对 于 
用 户 需 求 的 “直接 可 用 性 ”可 能 会 比肩 查 全 率 和 查 准 
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写作 辅助 工具 等 。 在 信息 服务 领域 ，LLMs 在 文献 内 容 
挖掘 、 知 识 服务 、 智 慧 图 书馆 建设 、 公 共 文化 教育 等 
领域 显示 了 巨大 的 能 力 ， 赋 能 图 书馆 与 情报 所 等 机 构 
的 咨询 服务 、 知 识 服务 、 查 新 服务 向 智能 化 转型 。 

当 LLMs 真正 在 信息 检索 领域 普遍 落地 ， 用 户 对 
仿 索 结果 的 期 望 可 能 会 逐渐 提高 ， 仪 向 用 户 提 供 查 全 
率 和 查 准 率 可 靠 的 参考 信息 将 不 能 满足 用 户 的 全 部 信 
息 需 求 ， 用 户 可 能 要 求 得 到 直接 可 用 的 信息 或 知识 产 
品 。 从 目前 LLMs 的 使 用 情况 看 ， 用 户 在 未 来 可 能 
求 信 息 检索 服务 拥有 更 加 智能 化 、 知 识 化 以 及 个 性 化 
的 服务 ， 包 括 问题 答疑 、 程 序 代 码 修改 、 实 时 教学 等 
要 求 ， 或 者 希望 信息 检索 系统 直接 提供 检 出 文献 的 摘 
要 合集 、 研 究 方法 比较 、 思 维 导 图 、 可 视 化 图 表 等 。 
LLMs 的 即时 响应 和 “类 人 化 ”等 特性 也 会 让 用 户 对 响 
应 时 间 和 个 性 化 定制 的 要 求 更 加 苛 刻 。 

值得 一 提 的 是 ， 由 于 当前 的 LLMs 在 数据 可 靠 性 、 
知识 产权 归属 、 技 术 伦理 建设 等 方面 存在 问题 ， 信 息 用 
户 对 LLMs 普及 的 态度 也 呈现 两 极 化 趋势 外 ， 因 此 如 何 
解决 这 些 问题 与 挑战 是 未 来 LLMs 发 展 吸 须 解 决 的 问题 。 


4 LLMs 背景 下 信息 检索 服务 部 门 的 
应 对 策略 


41 新 时 代 信 息 检索 服务 需 重 视 LLMs 等 
AIGC 技术 的 应 用 


目前 ChatGPT 等 LLMs 模型 仍 处 于 新 生 阶段 ， 存 
在 可 靠 性 不 高 等 问题 ， 仍 立即 无 法 取代 搜索 引擎 等 传 
统 工具 。 然 而 其 强大 功能 已 经 影响 了 相关 产业 和 社会 
的 发 展 方向 ，AI 领域 的 领导 者 已 经 开始 将 大 规模 资源 
投入 类 似 产品 的 训练 与 研发 中 。 随 着 文本 、 图 片 、 音 
频 、 视 频 等 多 模 态 和 跨 模 态 的 AIGC 产品 不 断 落地 ， 
LLMs 将 在 更 多 领域 得 到 利用 。 如 Nvidia 创始 人 与 


CEO 黄 仁 勋 所 言 : “这 是 人 工 智能 的 iPhone 时 刻 。” 
如 同 苹果 公司 通过 智能 手机 让 移动 互联 网 普及 使 
Web2.0 时 代 进 入 全 盛 时 期 一 样 ， 有 理由 相信 LLMs 也 
会 在 未 来 重 塑 行业 生态 ， 甚 至 改变 人 类 的 日 常生 活 。 
LLMs 在 自动 摘要 、 主 题 识别 、 智 能 推荐 、 虚 实 交 互 、 
知识 服务 的 领域 展现 了 不 俗 的 实力 ， 对 图 书馆 、 情 报 
所 等 机 构 的 信息 资源 建设 具有 建设 性 的 价值 。 而 随 着 
未 来 AIGC 技术 不 断 落地 、 生 产 内 容 不 断 增 加 ， 文 献 
情报 机 构 能 够 为 人 工 智 能 训练 提供 丰富 的 高 质量 语 料 ， 
同时 也 能 在 信息 更 加 爆炸 的 时 代为 用 户 筛选 、 组 织 、 
提供 可 信 度 强 的 高 质量 信息 资源 ， 拥 有 特定 的 优势 与 
价值 。 信 息 检 索 服 务 部 门 应 充分 关注 AIGC 技术 在 图 
书 情报 领域 的 浴 力 和 应 用 情况 ， 充 分 发 挥 人 工 智能 的 
辅助 作用 。 


4.2 信息 检索 系统 建设 可 充分 利用 LLMs, 
助 推 检索 服务 精细 化 、 智 能 化 


ChatGPT 上 线 后 ， 最 先 积 极 应 对 的 就 是 Google, 
百度 等 以 搜索 引擎 等 传统 信息 检索 工具 为 主 营业 务 的 
企业 。 微 软 公司 也 将 其 第 一 个 应 用 GPT 模型 的 产品 选 
定 为 旗下 的 搜索 引擎 Bing， 这 些 都 从 侧面 证 明 LLMs 
会 为 网 络 信息 检索 领域 带 来 一 场 革命 。 而 从 目前 图 书 
馆 、 情 报 所 等 信息 机 构 提 供 的 服务 来 看 ， 虽 然 知 识 服 
务 与 智能 服务 的 概念 早已 出 现 ， 但 直接 面向 知识 元 的 
知识 检索 服务 仍然 较 少 ， 提 供 的 检索 服务 主要 还 是 为 
用 户 获取 文献 资源 或 提供 文献 内 容 。 

随 着 LLMs 的 不 断 应 用 ， 信 息 检 索 服务 平台 广泛 
提供 细 粒 化 的 知识 服务 成 为 可 能 ， 比 如 知识 问答 服务 、 
辅助 写作 服务 等 。 同 时 LLMs 的 即时 交互 特性 也 能 助 
推 信息 检索 服务 朝 着 更 加 智能 化 、 泛 在 化 的 方向 前 进 ， 
比如 图 书馆 可 以 将 语言 模型 接 和 人 虚拟 馆 员 、 问 答 机 器 
人 等 设备 ， 直 接 帮 助 用 户 解 决 问题 ;科学 数据 库 可 以 
利用 大 语言 模型 ， 实 现 检索 后 自动 生成 文献 内 容 简报 、 
检索 结果 报告 等 功能 。 信 息 检 索 服务 提供 平台 还 可 以 
在 研究 基础 上 将 LLMs 逐渐 应 用 于 搜索 引擎 建设 A 
意 启 发 启迪 、 教 育 教学 辅助 、 文 献 情报 挖掘 等 项 目 中 ， 
充分 利用 AIGC 功能 的 潜能 ， 为 用 户 提供 更 强 的 情报 


RUSE, XEŽ 
大 语言 模型 对 信息 检索 系统 与 用 户 检索 行为 影响 研究 


生产 力 。 


4.3 适时 修订 信息 素养 教育 内 容 ， 帮 助 信息 
检索 系统 用 户 理 性 认识 与 使 用 Al 工具 


LLMs 的 广泛 应 用 势必 改变 大 众 的 信息 行为 ， 当 
AIGC 平台 成 为 检索 主流 ， 公 众 大 规模 使 用 AI 获取 信 
息 时 ， 原 有 的 以 筛选 信息 和 查 全 查 准 为 核心 的 信息 素 
养 课程 就 会 显得 过 时 。 如 何 培养 甄别 可 靠 信 息 、 回 淹 
信息 来 源 、 苯 重 知识 产权 等 技能 和 意识 将 成 为 “AI+” 
时 代 信 息 素养 培育 的 重要 内 容 。 同 时 ， 虽 然 AI 工具 在 
信息 识别 、 获 取 、 处 理 、 机 械 生产 等 步骤 能 够 超越 人 
类 ， 但 情报 的 价值 最 终 仍然 体现 于 人 类 如 何 挖掘 和 使 
用 情报 。 信 息 的 背后 可 能 有 着 隐 含 的 人 文 社 会 背景 或 
深刻 的 情感 ， 仅 将 语 料 渗透 不 意味 着 AIGC 内 容 已 经 
完全 反映 人 类 的 高 级 智能 活动 。 未 来 的 信息 素养 教 
应 该 在 原 有 基础 上 应 更 加 注重 批判 性 思维 的 培养 与 
知识 产权 意识 的 科普 ， 提 升 公众 的 推理 与 判断 能 力 ， 
让 公众 在 利用 AI 工具 时 保持 使 用 与 理性 的 平衡 ,保障 
“以 人 为 本 ”的 人 文 环境 。 


rol 


ay ae 


未 来 中 国 将 迎 来 AIGC 技术 与 产业 发 展 的 高 峰 期 ， 
以 GPT 技术 为 标志 的 大 型 语言 模型 将 以 其 强大 的 语义 
理解 能 力 和 智能 重 塑 用 户 的 信息 行为 。 本 研究 分 别 站 
在 信息 资源 建设 者 与 信息 用 户 的 角度 ， 探 讨 了 LLMs 
等 AI 工具 可 能 会 对 信息 搜索 行为 产生 的 影响 ， 并 为 图 
书 情报 行业 工作 者 提出 一 些 建议 。 

LLMs 虽然 目前 在 可 用 性 、 可 信 度 等 方面 存在 问 
题 ， 仍 无 法 在 专业 和 重要 领域 实现 完全 落地 ,但 目前 
LLMs 在 信息 检索 、 知 识 组 织 、 智 能 问答 等 领域 所 表现 
出 的 实力 已 经 足以 改变 用 户 信 息 搜寻 的 习惯 ， 带 来 不 
容 小 遍 的 影响 。 目 前 LLMs 等 工具 以 其 优秀 的 语义 理 
解 能 力 已 经 让 人 们 感受 到 AI 运用 于 工作 与 生活 的 便 
利 ， 相 信 未 来 LLMs 也 会 为 文献 情报 行业 带 来 诸多 机 
遇 与 挑战 。 信 息 资源 建设 机 构 应 努力 推动 AI 技术 与 资 
源 建设 的 融合 ， 为 未 来 向 用 户 提 供 高 效 高 质 的 信息 资 


2023 年 第 35 卷 第 11 期 


20 


农业 图 书 情报 学 报 


DOI, 


10.13998/j.cnki.issn1002-1248.23-0573 


源 服务 打 好 基础 。 


参考 文献 : 


[1] 


[2] 


[3] 


[4] 


[5] 


[6] 


[7] 


[8] 


OPENAL Introducing ChatGPT[EB/OL]. [2023-07-21]. https://ope- 
nai.com/blog/chatgpt. 

冯 志 伟 , 张 灯 柯 , 侯 高 琦 
RETR BOARS]. 语言 战略 研究 , 2023, 8(2): 20-24. 


. 从 图 灵 测 试 到 ChatGPT 一 一 人 机 对 话 


FENG Z W, ZHANG D K, RAO G Q. From Turing test to ChatGPT: 
A milestone of man -machine interaction and its enlightenment [J]. 
Chinese journal of language policy and planning, 2023, 8(2): 20-24. 
张 智 雄 , 于 改 红 , XIEN, 等 . ChatGPT 对 文献 情报 工作 的 影响 
数据 分 析 与 知识 发 现 , 2023, 7(3): 36-42. 


ZHANG Z X, YU G H, LIU Y, et al. The influence of chat GPT on 


library & information services[J]. Data analysis and knowledge dis- 


covery, 2023, 7(3): 36-42. 


ER, 吴 晨 生 , 董洁 , 等 . ChatGPT 对 开源 情报 工作 的 影响 及 对 策 中 
情报 理论 与 实践 , 2023, 46(5): 1-5. 

LI R, WU C S, DONG J, et al. Study on the impact of ChatGPT on 
open source intelligence work and countermeasures[J]. Information 
studies: Theory & application, 2023, 46(5): 1-5. 

李 书 宁 , 刘 一 鸣 . ChatGPT 类 智能 对 话 工具 兴起 对 图 书馆 行业 的 
机 遇 与 挑战 四 . 图 书馆 论坛 , 2023, 43(5): 104-110. 

LI S N, LIU Y M. Opportunities and challenges for library from the 
rise of ChatGPT-like intelligent chat tools[J]. Library tribune, 2023, 
43(5): 104-110. 

张 海 , 刘畅 , 王 东 波 , 等 户 使 用 意愿 


情报 理论 与 实践 , 2023, 46(4): 15-22. 


=. ChatGPT | 


影响 因素 研究 中. 


ZHANG H, LIU C, WANG D B, et al. Research on the influencing 
factors of ChatGPT users' intention[J]. Information studies: Theory & 
application, 2023, 46(4): 15-22. 

LA. 信息 检索 研究 进展 四. 农业 图 书 情 报 学 


115-117. 


, 2010, 22(8): 


WANG C X. Research progress in information retrieval[J]. Journal of 
library and information sciences in agriculture, 2010, 22 (8): 115- 


117. 


孙 坦 , 周 静 怡 . 近 几 年 来 国外 信息 检索 模型 研究 进 


建设 , 2008(3): 82-85. 


RL. 图 书馆 


2023 年 第 35 卷 第 11 期 


[9] 


[10] F 


[11] 


[12] 


[13] 


[14] 罗 


[15] 


[16] 


SUN T, ZHOU J Y. The review of information retrieval models in 


recent years|J]. Library development, 2008(3): 82-85. 


RFH, 齐 和 庆 . 信息 检索 模型 及 其 在 跨 语 言 信息 检索 中 的 应 用 进 


IJ 现代 情报 , 2009, 29(7): 215-221. 


WU D, QI H Q. Development of information retrieval model and its 
application in cross-language information retrieval [J]. Journal of 
modern information, 2009, 29(7): 215-221. 

薛 向 阳 . 多 媒体 信息 检索 研究 进展 : 从 检索 到 推荐 再 到 生成 [J]. 
世界 科学 , 2021(6): 29-31. 


XUE X Y. Research progress of multimedia information retrieval: 
From retrieval to recommendation to generation[J]. World science, 
2021(6): 29-31. 
吴 智 兰 , ESCH, 张 帅 , 等 . 大 学 生 在 线 健康 信息 检索 行为 特征 及 


模式 中. 图 书馆 论坛 , 2019, 39(8): 74-82. 


WU ZL, WANG W T, ZHANG S, et al. Characteristics and pat- 

terns of college students’ online health information retrieval behav- 

iors[J]. Library tribune, 2019, 39(8): 74-82. 

张 敏 , 县 瑞 , 罗 梅 分 . 基于 需求 类 型 与 性 别 差异 的 网 络 健康 信息 
AT ARE PT]. 情报 资料 工作 , 2017(2): 63-69. 


ZHANG M, NIE R, LUO M F. Analysis on the characteristics of net- 
work health information retrieval based on demand type and gender 
difference[J]. Information and documentation services, 2017 (2): 63- 
69. 
BILAL D, KIRBY J. Differences and similarities in information 
seeking: Children and adults as web users[J]. Information process- 
ing & management, 2002, 38(5): 649-670. 

赛 峰 . 儿童 信息 检索 行为 若干 问题 的 讨论 加. 图 书馆 杂志 ， 
2015, 34(8): 70-74, 77. 
LUO S F. Discussion on children's information retrieval behaviors [J]. 
Library journal, 2015, 34(8): 70-74, 77. 
张 路 路 , BEL. 基于 认 知 风格 的 数字 图 书馆 ) 


F. 情报 学 报 , 2018, 37(11): 1164-1174. 


户 信息 检索 行为 研 


ZHANG L L, HUANG K. Information searching behavior of digital 


library users based on their cognitive styles[J]. Journal of the China 


society for scientific and technical information, 2018, 37(11): 1164- 
1174. 


MOHAMMAD ARIF A S, DU J T. Understanding collaborative 


[17] 


[18] 


[19] 


[20] 


[21] 


tourism information searching to support online travel planning[J]. 
Online information review, 2019, 43(3): 369-386. 
EXP, 张 行 萍 , DER, 等 . 在 线 健康 信息 检索 行为 实验 研究 内 


REL BAAR S|. 图 书 情报 工作 , 2020, 64(3): 119-129. 


WANG W T, ZHANG X P, LUO Q F, et al. The review and enlight- 
enment of online health information seeking behavior experimental 
research contents[J]. Library and information service, 2020, 64 (3): 


119-129. 


王 若 佳 , 李 培 . 基于 日 志 挖 掘 的 ) 


j 户 健康 信息 检索 行为 研究 四. 


图 书 情报 工作 , 2015, 59(11): 111-118. 

WANG R J, LI P. A study on health information search behavior 
based on log mining[J]. Library and information service, 2015, 59 
(11): 111-118. 

EME. 大 学 生 网 络 学 术 信 息 检索 行为 研究 [D]. 镇 江 : 江苏 大 学 ， 


2016. 


WANG L J. Research on college students' network academic infor- 
mation retrieval behavior[D].Zhenjiang: Jiangsu University, 2016. 
A a. TERS UALS PPM eT A Be [I]. 图 书 


馆 学 刊 , 2019, 41(6): 10-13, 17. 


CUI D Y. Research on user information retrieval behavior model 
from the perspective of emotion and cognition[J]. Journal of library 
science, 2019, 41(6): 10-13, 17. 


张海涛 , TRAE, BLE, 等 . 网 络 用 


户 信 息 检索 行为 研究 进展 [J]. 


[22] 


[23] 


[24] 


[25] 


郭 鹏 蹇 ， 文 庭 孝 


检索 行为 影响 研究 


大 语言 模型 对 信息 检索 系统 与 


情报 科学 , 2020, 38(5): 169-176. 

ZHANG H T, ZHANG X H, WEI P, et al. Research progress on 
network user information retrieval behavior[J]. Information science, 
2020, 38(5): 169-176. 

潘 正 源 , 李 樵 , 李 月 琳 , 等 . 智能 信息 检索 研究 范式 的 演进 、 反 思 


与 前 瞻 [J/OU]. 图 书馆 论坛 , 1-15[2023-08-16]. http://kns.cnki.net/ 


kcms/detail/44.1306.G2.20230807.1139.004.html. 

PAN Z Y, LI Q, LI Y L, et al. Evolution, reflection and prospect of 
the paradigm of intelligent information retrieval research [J/OL]. 
Library tribune, 1-15[2023-08-16]. http://kns.cnki.net/kems/detail/ 
44.1306.G2.20230807.1139.004.html. 

寿 建 琪 . 走向 “已 知之 未 知 ”: CPT 大 语言 模型 助力 实现 以 人 为 本 
的 信息 检索 中. 农业 图 书 情报 学 报 , 2023, 35(5): 16-26. 


SHOU J Q. Towards known unknowns: GPT large language models 
empower human-centered information retrieval[J]. Journal of library 
and information science in agriculture, 2023, 35(5): 16-26. 

WAGNER M W, ERTL-WAGNER B B. Accuracy of information and 
references using ChatGPT -3 for retrieval of clinical radiological 


information [J]. Canadian association of radiologists journal, 2023: 


084653712311711. 
xi Jal. ChatGPT 为 何 一 边 “ 横 扫 ” 校 园 , 一 边 遭 受 封杀 ?[EB/OL]. 


[2023-04-12]. https://www.thepaper.cn/newsDetail_forward_219533 


13. 


Research of the Impact of LLMs on Information Retrieval Systems 
and Users' Information Retrieval Behavior 


GUO Pengrui, WEN Tingxiao” 


(Department of Biomedical Informatics, School of Life Science, Central South University, Changsha 410006) 


Abstract: [Purpose/Significance] This article is aimed to explore the impact of artificial intelligence generation technologies such as large 


language models (LLMs) on users' information retrieval behavior and to suggest ideas for information retrieval systems and information 
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resource construction. In this way, it provides insights into and references for the future establishment of the artificial intelligence 
generated content (AIGC) information platform with Chinese characteristics as well as the information literacy education system. 
[Method/Process] In the field of library intelligence, with the wide application of AI technology in information service work, LLMs 
represented by ChatGPT have also become a hot topic of discussion. Taking the booming development of LLMs such as ChatGPT as 
background, we analyzed the impact of the increasing popularity of this technology on information retrieval systems and user retrieval 
behavior from the perspective of user information behavior by combining the technical features of LLMs with the characteristics of 
existing products. Literature survey and empirical analysis were used. [Results/Conclusions] The use of LLMs as information retrieval 
systems has unparalleled advantages over traditional products. These advantages include the ability to understand and process natural 
language queries, generate relevant and context-specific responses, and interact with users in a more human-like way. The application of 
LLMs in information retrieval systems has the potential to transform the way users search for information, influence the underlying logic, 
action priorities, and retrieval expectations of user information retrieval behavior. However, the existing shortcomings of LLMs in terms 
of reliability and accuracy still make it difficult for them to replace traditional information retrieval methods immediately. Language 
models may not always provide accurate and reliable answers, especially when dealing with complex or domain-specific queries. 
Additionally, LLMs may struggle to understand and process contextual information effectively, leading to limitations in their ability to 
extract relevant and context-aware insights. It is recommended to pay attention to this technology in the construction of information 
retrieval systems and information resources, and to explore the combination of LLMs and information services in order to cope with the 
changes in future user information needs and to further make full use of the value of existing information resources. Limited by the lack 
of expertise in the field of AI and the fact that LLMs are not yet widely used in practice in China, the research findings are only a 
reflection and exploration of the impact of LLMs on users' information behavior. 
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